收录于话题
#计算机科学史
25个
作者:Slava Gerovitch(麻省理工学院数学史讲师,也是太空史和俄罗斯科学技术的专家)
原文:The Man Who Invented Modern Probability
译者:hhhnoone
如果两个统计学家在无边无际的森林中失去了对方,他们做的第一件事就是喝醉,这样,他们就能够或多或少地随意走动,相互找到对方的机会也会大大增加。然而,如果统计学家们想采蘑菇,那么他们应该保持清醒,因为醉酒而漫无目的地四处走动会减少统计学家们的探索区域,使他们更有可能回到蘑菇已经被采过的地点。
上述设想属于统计学理论中的“随机漫步”(random walk)或“醉汉漫步”(drunkard’s walk),在该理论中,未来只取决于现在,而不是过去。今天,这一理论被用于模拟股票价格、分子扩散、神经活动和种群动态等过程,它也被认为可以描述“遗传漂移”(genetic drift)如何导致特定基因(比如蓝眼睛)在人群中变得普遍的。具有讽刺意味的是,这种无视过去的理论有着相当丰富的历史,它是安德烈·科尔莫戈罗夫(Andrei Kolmogorov)的诸多理论之一。
1933年,俄国数学家科尔莫戈罗夫建立了国际公认的概率论公理体系,以“概率测度”为核心,严格定义了概率论的语言,堪称“概率理论界的欧几里德几何公理体系”。科尔莫戈罗夫是一位具有惊人广度和能力的数学家,他在不断平衡苏联动荡的政治与学术生活的人生中,彻底改变了“不可能”(unlikely)在数学中的角色。
闯入概率论的世界
年轻时,科尔莫戈罗夫受到了后革命时代莫斯科活跃思想的影响。那个年代里充斥着文学实验、前卫艺术和激进的新科学思想。20世纪20年代初,当时只有17岁的他还是一名历史系学生,他在莫斯科大学提交了一篇论文,对中世纪俄罗斯人的生活进行了非常规的统计分析。那篇论文中指出,政府对村庄征收的税收通常是一个整数,而对每个家庭征收的税通常用小数表示,由此该论文的结论是:税收是对整个村庄征收,然后在家庭之间分配,而不是强加在家庭身上,由村庄收集起来,这个结论在当时是有争议的。“你只找到了一个证据,”他的教授尖刻地说。“这对历史学家来说是不够的。你至少需要五份证明”。这时,科尔莫戈罗夫决定把注意力转移到数学上,因为在这个领域一个证明就足够了。更意外的是,一次偶然的机会把科尔莫戈罗夫拉进了概率论的怀抱,而概率论在当时是数学的一个子学科,且该学科在当时受到众人诋毁,因为前现代社会往往把概率/机会看作是神的意愿的表达——在古埃及和古典希腊,掷骰子被视为一种可靠的占卜和算命的方法(当然,概率论不这么认为)。到19世纪早期,欧洲数学家已经知道了如何计算概率,并将概率归结为目标事件的数量与所有等可能事件的数量的比率。但是这种方法有缺陷。概率是用等可能的事件来定义的,并且只适用于可能结果数目有限的系统。它不能处理可数的无穷大,例如具有无限面的骰子游戏,或连续体,例如球面骰子游戏,球面上的每个点代表一个可能的结果。换专业后,科尔莫戈罗夫最初进入莫斯科大学(Moscow University)数学圈,该数学圈由一位魅力非凡的老师尼古拉·卢津(Nikolai Luzin)领导。卢津的弟子们给这个组织起了个绰号叫“卢齐塔尼亚”(Luzitania),这是对他们教授的名字和在第一次世界大战中沉没的著名英国军舰的双关。用科尔莫戈罗夫的话来说,他们是通过一种“共同跳动的心”团结在一起的,他们常常下课后聚在一起宣扬或抨击新的数学创新。他们把偏微分方程戏称为“偏不尊重方程”(partial irreverential equations),把有限差分戏称为“夜间差分”(fine night differences),概率论缺乏坚实的理论基础,充满了悖论,被他们戏称为“不幸论”(theory of misfortune.)。受卢兹塔尼亚的影响,科尔莫戈罗夫对概率论的观点产生了转变。到了20世纪30年代,斯大林主义恐怖主义的爆发,秘密警察会在夜间敲响任何人的门,这种盲目的可能性似乎支配着人们的生活。许多俄罗斯人因恐惧而麻痹,被迫参与谴责行动,以期望增加自己的生存机会。数学家中的布尔什维克活动分子,包括卢津以前的学生,指责卢津在政治上不忠诚,并谴责他在国外出版作品。由于科尔莫戈罗夫本人同样在国外发表过作品,他意识到了自己也可能成为被批判的对象。为了自己的职业生涯,他表现出明显的政治妥协意愿,在他的前任因支持宗教自由而被布尔什维克政权监禁时,他接受了研究所所长的职位。并且科尔莫戈洛夫加入了反对卢津的批评阵营。卢津受到了科学院的审判,失去了所有官方职位,但令人惊讶的是,他逃脱了俄罗斯当局的逮捕和枪决。“卢兹塔尼亚号”已经失踪,被自己的船员击沉(意指当初的数学圈不再存在或者卢津消失)。撇开科尔莫戈洛夫所做出的决定的道德层面不谈,他成功地把握住了机会,获得了继续工作的自由。而面对自己政治上的一致性,科尔莫戈洛夫对概率论提出了一种激进的、最终基本的修正。他依靠的是度量理论,这是从法国传入俄国的一种时髦理论。测度理论将代表了“长度”、“面积”或“体积”等概念泛化,允许在常规方法不能满足要求的情况下,对各种奇怪的数学对象进行测度。例如,它可以通过把物体切成无数个小块,并分散在无限个平面上,以计算出一个有无数个洞的正方形的面积。在测度理论中,我们仍然可以谈论这个分散物体的“面积”(测度)。科尔莫戈洛夫将概率和测度进行了类比,得出了五个公理,现在通常用六个表述来阐述,这些公理使概率论在数学中开始受到尊敬。科尔莫戈洛夫理论中最基本的概念是“基本事件”,即一个实验的结果,就像抛硬币一样,(其基本事件为硬币正面或反面)。所有基本事件形成了一个“样本空间”,即所有可能结果的集合。以马萨诸塞州的雷击为例,样本空间将包含该州所有可能发生雷击的点。随机事件被定义为样本空间中的“可测量集合”,随机事件的概率被定义为该集合的“度量”。例如,闪电击中波士顿的概率仅取决于该城市的面积(度量)。同时发生的两个事件可以用它们的度量值的交集来表示;两种不相容事件中某一事件发生的概率是通过相加计算得出的(也就是说,波士顿或剑桥被闪电击中的概率等于它们的面积之和)。
大圆悖论(The Paradox of the Great Circle)是一个主要的数学难题,科尔莫戈洛夫提出的概率理论最终解决了这个难题。假设外星人随机降落在一个完美的球形地球上,并且着陆的概率是平均分布的。这是否意味着它们降落在将地球分成两个相等半球的圆环上(也就是所谓的“大圆”上)的任何地方的概率都是相等的呢?“事实证明,登陆概率沿赤道分布均匀,但沿子午线分布不均匀,向赤道方向的概率增大,在两极则减小。”换句话说,外星人会倾向于在更热的气候下着陆。这个奇怪的发现可以用纬度圈越接近赤道越大来解释。然而这个结果似乎很荒谬,因为我们可以旋转球体,把它的赤道变成子午线。科尔莫戈洛夫表明大圆具有的度量值为零,因为它是线段,其面积为零,他通过表明无法严格计算这些概率,有效地解释了大圆悖论。科尔莫戈洛夫从斯大林主义大清洗的真实世界跨入了零测度条件概率世界没多久,很快又回到了现实。
“不可能”在人类事务中的作用
在第二次世界大战期间,俄罗斯政府要求科尔莫戈洛夫研究提高炮火效率的方法。他证明,在某些情况下,与其试图最大限度地提高每一枪击中目标的可能性,不如在与完美目标存在较小偏差的情况下采用齐射策略,这种战术被称为“人工分散”。他担任负责人的莫斯科大学概率论系,也为低空、低速轰炸计算弹道表。1944年和1945年,政府授予科尔莫戈洛夫两个列宁勋章,以表彰他在战时的贡献。战后,科尔莫戈洛夫担任热核武器计划的数学顾问。科尔莫戈洛夫同样也对哲学感兴趣。数学使他相信,世界既是由机遇驱动的,又是根据概率定律而有序运行的。他经常思考“不可能”在人类事务中所起的作用。1929年,科尔莫戈洛夫在一次独木舟旅行中偶然遇见了他的同事数学家帕维尔·亚历山德罗夫,从此他们开始了亲密的终身友谊。在一封冗长而坦率的信中,亚历山德罗夫指责科尔莫戈洛夫喜欢在火车上和陌生人交谈,暗示这种接触太肤浅,无法了解一个人的真实性格。科尔莫戈洛夫对此表示反对,他以一种激进的概率观看待社交互动,在这种互动中,人们充当了更大群体的统计样本。“一个人倾向于吸收周围的精神,将后天养成的生活方式和世界观宣扬给周围的任何人,而不仅仅是一个精选的朋友,”他给亚历山德罗夫回信说。音乐和文学对科尔莫戈洛夫非常重要,他认为他可以对它们进行概率分析,从而洞察人类思维的内部运作。科尔莫戈洛夫是一个文化精英,相信艺术价值的等级制度。处于最高级别的是歌德、普希金和托马斯·曼的作品,以及巴赫、维瓦尔第、莫扎特和贝多芬的作品——这些作品的永恒价值类似于永恒的数学真理。科尔莫戈洛夫强调,每一件真正的艺术作品都是独一无二的创作,是某种无法被定义的东西,是某种超出简单统计规律范围的东西。“有没有可能把(托尔斯泰的《战争与和平》)以一种合理的方式纳入“所有可能的小说”的集合中,并进一步假定在这一集合中存在某种概率分布?他在1965年的一篇文章中讽刺地问道。科尔莫戈洛夫渴望找到理解艺术创造力本质的钥匙。1960年,科尔莫戈洛夫给一组研究人员配备了机电计算器,让他们负责计算俄罗斯诗歌的节奏结构。他对实际节奏(actual rhythms)与古典节奏(classical meters.)的偏离特别感兴趣。在传统诗学中,抑扬格韵律是由一个非重读音节和一个重读音节组成的节奏。但在实践中,这条规则很少被遵守。普希金的《叶甫盖尼·奥涅金》是俄文最著名的古典抑扬格诗歌,5300行诗中几乎有四分之三违反了抑扬格韵律的定义,超过五分之一的音节是非重读的。科尔莫戈洛夫认为,重音偏离古典韵律的频率为诗人提供了一个客观的“统计肖像”。他认为,一种不太可能的重音模式表明了艺术的创造性和表现力。通过研究普希金、帕斯捷尔纳克和其他俄罗斯诗人,科尔莫戈洛夫认为,他们篡改了韵律,为自己的诗歌或段落赋予了“普遍色彩”。为了衡量文章的艺术价值,科尔莫戈洛夫还采用了字母猜测法来评估自然语言的熵值(entropy )。在信息论中,熵是对不确定性或不可预测性的度量,与信息的信息内容相对应:信息的不可预测性越高,它携带的信息就越多。科尔莫戈洛夫把熵变成了一种衡量艺术独创性的尺度。他的团队进行了一系列的实验,给志愿者们展示了一段俄罗斯散文或诗歌,并让他们猜下一个字母,然后再猜下一个,如此循环。科尔莫戈洛夫私下评论说,从信息论的观点来看,苏联报纸的信息量不如诗歌,因为政治话语使用了大量的固定短语,其内容是很容易预测的。另一方面,尽管伟大诗人的诗歌形式对他们有严格的限制,但他们的诗作却很难预测。根据科尔莫戈洛夫的说法,(不可预测性)这是他们独创性的标志。科尔莫戈洛夫对把《战争与和平》放在所有小说的概率样本空间的想法嗤之以鼻——但他可以通过计算《战争与和平》的复杂性来表达其不可预测性。科尔莫戈洛夫认为复杂性是对一个对象最短描述的长度,或者是产生一个对象的算法的长度。确定性对象很简单,因为它们可以通过一个简短的算法产生:比如,一个由0和1组成的周期性序列。真正随机的、不可预测的对象是复杂的:任何再现它们的算法都必须和对象本身一样长。例如,无理数(那些不能被写成分数的数字,小数点后的数字几乎肯定没有规律)。因此,大多数无理数都是复杂的物体,因为它们只能通过写出实际的序列来复制。这种对复杂性的理解符合直觉的概念,即没有任何方法或算法可以预测随机对象。现在,这种观点作为衡量指定对象所需计算资源的标准是至关重要的,在现代网络路由、排序算法和数据压缩中有多种应用。按照科尔莫戈洛夫自己的标准,他的生活是复杂的。他于1987年去世,享年84岁。他经历了一场革命、两次世界大战和冷战,但是他并没有受到时代影响,持续在数学领域保持创新,而且远远超出了学术界的限制。无论他的生活是醉酒的随意漫步,还是采摘蘑菇的随意漫步,其曲折和曲折既不是特别容易预测,也不容易描述。他在捕捉和应用不可能事件方面的成功,修复了概率论,并为无数科学和工程项目创造了一块土地。但他的理论,也放大了用人类直觉描述不可预测性和用数学工具描述不可预测性的两种学说之间的紧张关系。对于科尔莫戈洛夫来说,他的学说既没有消除概率,也没有肯定我们这个世界的根本不确定性;他们只是提供了一种严谨的语言来讨论那些无法确定的事情。他曾经说过,“绝对随机性”的概念和“绝对决定论”一样没有意义,他的结论是,“我们不能对不可知事物的存在有肯定的认识。”不过,多亏了科尔莫戈洛夫,我们可以解释什么时候不能以及为什么我们不能。https://medium.com/nautilus-magazine/the-man-who-invented-modern-probability-342c77b9c517数据实战派希望用真实数据和行业实战案例,帮助读者提升业务能力,共建有趣的大数据社区。